import pandas as pd

pd.set_option('display.expand_frame_repr', False)
pd.set_option('display.max_rows', None)
pd.set_option('display.max_columns', None)
pd.set_option('display.width', 100)

def parse_date(date_list):
    date_list = list(date_list)  # 确保是副本，而不是视图
    for i, d in enumerate(date_list):
        if len(d) == 4 and d.isdigit():
            date_list[i] = f"{d}-01-01"

    return pd.to_datetime(date_list)

# 读取数据
data = pd.read_excel("../doc/datasource/C8-8.5-数据采集-clean.xlsx")
# print(data.head(3))  # 只打印前30个数据

# 读取日期
# print(data['release_date'])

# 对年份进行统计
# 把字符串的日期转换为日期格式
data['release_date'] = parse_date(data['release_date'])
data = data.set_index(data['release_date'])
data_year_tj = data['release_date'].resample('YE').count()

# 打印统计的数据
print(data_year_tj)
